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摘 要 : [目的 /意义 ] 以 我 国 14 个 省 级 政府 开放 数据 平台 为 研究 对 象 ,从 多 个 维度 对 其 进行 比较 分 析 , 为 我 国政 府 开放 数 
据 平 台 的 发 展 提供 参考 建议 。[ 方法 “过程 ] 通 过 爬虫 技术 获取 数据 ,对 数据 进行 描述 性 分 析 , 并 采用 Tf-idf 模型 进 
行文 本 挖掘。 以 数据 层 维 度 和 平台 层 维度 为 出 发 点 ,使 用 定性 和 定量 分 析 方 式 , 对 数据 资源 细 粒 度 、 领 域 分 布 、 时 
效 性 、 格 式 种 类 、 检 索 种 类 、 访 问 转换 率 、 用 户 反 馈 方面 进行 比较 。| 结果 /结论 ] 目前 各 省 级 开放 数据 平台 发 展 程 
度 不 同 , 存 在 一 定 的 改进 空间 ,如 应 当 结 合 本 省 (区 \ 市 ) 特 点、 数据 集 数 量 等 综合 考量 数据 集 的 发 布 方案 ,建设 过 
程 中 需要 注意 开放 平台 数据 检索 方式 、 培 训 工 作 以 及 用 户 反 馈 等 方面 。 
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政府 开放 数据 平台 是 提高 政府 透明 度 的 有 效 手段 
。 通 过 对 政府 数据 进行 开放 ,“ 旺 出 "政府 数据 资 
S 寻 能 保障 用 户 公开 获取 政府 数据 的 权利 ,从 而 提升 
对 底 府 的 信任 ,又 能 增加 用 户 的 参与 .互动 以 及 自我 赋 
权 之 随 着 一 些 对 个 人 或 者 企业 有 经 济 利用 价值 的 数据 
得 组 开 放 , 亦 能 推动 社会 经 济 的 增长 。 尽 管 我 国 还 未 
建国 家 级 的 统一 政府 开放 数据 平台 ,但 在 2021 年 2 
月 亚 日 ,国家 信息 中 心 发 布 ( 国 家 公共 数据 开放 平台 建 
设 朋 户 问卷 调查 通知 》 ,广泛 征求 社会 各 界 对 各 级 开放 
平台 的 意见 建议 及 对 国家 公共 数据 开放 的 具体 需求 ， 
则 在 进一步 提升 开放 平台 用 户 体验 ,促进 数据 供需 衔 
接 , 释 放 更 多 数据 开放 红利 ""。 这 个 通知 的 发 布 ,对 加 
快 推动 我 国政 府 开放 数据 平台 建设 的 进程 具有 重大 意 
义 ,而 地 方 政府 开放 数据 平台 是 国家 政府 开放 数据 平 
台 的 前 身 ,可 以 为 国家 政府 开放 数据 平台 建设 提供 经 
验 参 考 , 因 而 有 必要 加 强 对 我 国 省 市 政府 开放 数据 平 
台 的 研究 。 

从 现 有 研究 来 看 ,主要 采用 定性 和 定量 相 结合 的 
方法 ,从 不 同 维度 对 不 同 国家 、 地 区 的 开放 数据 平台 进 
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仙 等 选取 美国 .英国 日 本 澳大利亚 等 典型 国家 ,分 别 
从 政策 体系 保障 机 制 和 公开 系统 这 3 个 方面 进行 比 
较 ” ; 吴 钢 和 曾 丽 莹 选取 美国 ,英国 .澳大利亚 ,加拿大 
以 及 我 国 建设 较 早 的 北京 市 和 上 海 市 政府 开放 数据 平 
台 作为 调研 对 象 ,从 资源 现状 .组 织 和 检索 .服务 方式 
等 方面 探究 当前 国内 外 平台 的 发 展现 状 ”。@@ 和 省 市 政 
府 开放 数据 谭 必 勇 和 陈 艳 以 10 个 代表 性 东 、 
中 \ 西 部 省 \ 市 的 开放 政府 数据 平台 为 研究 对 象 ,对 我 
开放 数据 平台 的 质量 进行 研究 ; 余 奕 昊 和 李卫东 
以 数据 功能 、 接 口 功 能 、 应 用 功能 和 互动 功能 4 个 方面 
为 视角 ,对 比 10 个 省 市 政府 开放 数据 平台 的 数据 集 数 
量 ,接口 调用 次 数 等 数据 ,分 析 我 国 地 方 政府 开放 数据 
平台 的 现状 和 问题 ,并 提出 优化 对 策 ”。@ 城 市 政府 
开放 数据 平台 。 邓 胜利 和 夏 苏 迪 从 数据 层 和 平台 层 出 
发 ,以 中 美 8 个 城市 为 例 ,将 各 地 区 政府 开放 数据 平台 
资源 数量 ,访问 量 发 布 时 间 占 比 等 进行 对 比 ,指出 打 
造 数据 开放 平台 应 当 重 点 关注 民生 数据 的 开放 、 用 户 
体验 的 优化 等 内 容 ” 。 从 研究 方法 来 看 , 现 有 研究 多 
采用 比较 分 析 文献 分 析 等 定性 研究 和 描述 性 分 析 相 
结合 的 方法 ,而 较 少 侧重 文本 挖 据 的 方法 。 笔 者 在 不 
同 维度 的 对 比 基 础 上 ,采用 Tf-idf 文本 挖掘 模型 进行 
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行 对 比 ,具体 包括 :中 国家 级 政府 开放 数据 平台 。 杨 瑞 


在 下痢 


定量 分 析 ,力图 通过 文本 内 容 来 反映 出 更 为 真实 、 准 确 
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的 情况 。 从 研究 对 象 来 看 ,已 有 研究 大 多 关注 国家 级 
和 城市 政府 开放 数据 平台 ,虽然 也 有 研究 关注 省 级 政 
府 开放 数据 平台 ,但 这 些 研究 是 将 省 级 和 市 级 政府 开 
放 数 据 平台 放 在 一 起 进行 比较 ,而 较 少 专 门 针 对 省 级 
政府 开放 数据 平台 进行 比较 。 由 于 省 级 和 国家 级 、 市 
级 的 开放 数据 平台 所 对 应 的 行政 层级 不 一 样 ,而且 这 


2021 年 9 月 10-15 日 对 平台 数据 进行 采集 。 通 过 逐 
一 访问 这 18 个 省 级 政府 数据 开放 平台 进行 得 选 ,根据 
网 站 的 有 效 性 和 数据 采集 的 可 行 性 ,最 终 选 取 以 下 14 
个 省 (区 市) 为 研究 对 象 ,分 别 为 湖南 省 山东 省 、 陕 
西 省 ,江西 省 ,宁夏 回族 自治 区 ( 以 下 简称“ 宁夏”) 、 河 
南 省 .浙江 省 ,海南 省 .福建 省 .广东 省 .广西 壮族 自治 


些 平台 的 数据 资源 的 数量 .平台 规模 也 不 同 , 前 人 研究 
的 结论 在 各 省 级 开放 数据 平台 的 适用 程度 有 待 商 椎 。 
因此 ,有 必要 对 各 省 级 政府 开放 数据 平台 进行 专门 比 
较 , 从 中 总 结 成 功 的 经 验 ,发 现 可 能 存在 的 问题 并 加 以 
优化 ,为 后 续 我 国 地 方 政府 开放 数据 平台 的 发 展 和 
家 政府 开放 数据 平台 构建 提供 参考 。 


2_ 比 较 分 析 框架 


和 者 全 和 胜利 和 下头 地 中 的 分 类 视 和 ,从 数 折 
展台 层 两 个 维度 展开 对 比 四 。 数 据 资源 细 粒 度 , 领 
城 次 布 , 时 效 性 ,格式 种 类 能 在 一 定 程度 上 反映 政 府 开 
放 矣 据 平 台 开 放 的 广度 和 深度 ,作为 描述 数据 层 的 指 
标 ; 数 据 的 检索 种 类 访问 转换 率 和 用 户 反馈 则 能 反映 
用 甩 5 平 台 的 互动 交流 的 情况 ,作为 描述 平台 层 的 指 
德政 府 开放 数据 平台 具体 对 比 框架 见 表 1。 需 要 说 明 
的 加 ,一 级 指标 中 的 数据 资源 包括 数据 集 .APP API 其 
由 数据 集 是 指 原 始 数 据 经 过 加 工 之 后 得 到 的 包 全 数据 


区 (以 下 简称 "广西 ) 贵州 省 ,河北 省 、 四 川 省 (排名 
不 分 先后 ) 。 

需要 注意 的 是 ,统计 数据 时 可 能 存在 以 下 情况 : 
中 平台 的 数据 处 于 实时 更 新 状态 ,各 省 (区 、 市 ) 数 据 
可 能 存在 小 范围 的 请 后 性 以 及 并 非 同 天 统计 的 情况 ; 
@ 统 计时 网 页 失效 以 及 网 页 呈现 方式 为 图 表 形 式 , 导 
致 本 文 各 分 析 模 块 的 研究 省 (区 市) 数量 可 能 存在 稍 
许 不 同 ;@@ 由 于 个 别 省 (区 、 WR 
记录 数 很 少 ,为 了 方便 后 续 梳 理 结论 ,在 不 影响 结果 的 
情况 下 部 分 省 (区 eol 

笔者 采用 定性 和 定量 相 结 合 的 研究 方法 ,通过 Py- 
thon 代码 进行 候 虫 获取 各 省 (区 市) 的 原始 数据 集 记 
录 、APP 记录 、API 记录 等 原始 数据 ,对 数据 层 的 各 个 
指标 以 及 平台 层 的 检索 种 类 指标 、 访 问 转换 率 进行 对 
比分 析 ,并 利用 Tf-idf 模型 挖掘 用 户 在 互动 交流 时 关 
注 的 重点 内 容 ( 见 图 1)。 如 此 ,从 这 些 数据 分 析 中 发 
现 问题 ,提出 合理 建议 ,为 政府 开放 数据 平台 的 完善 提 


的 侯 合 ,其 数量 直接 反映 开放 数据 平台 的 发 展 程度 。 
A 区 是 开放 数据 平台 中 应 用 程序 模块 APP 数量 越 多 ， 
会 数据 集 的 可 用 性 越 强 。API 是 开发 人 员 对 政府 数据 
进行 调用 的 接口 ， API 数量 越 多 ,平台 数据 集 的 开放 程度 
越 雯 ,数据 资源 的 价值 发 挥 得 越 充 分 。 因 此 ,笔者 采用 
数据 集 、APP .API 三 者 综合 反映 数据 层 中 数据 资源 。 
表 1 政府 开放 数据 平台 比较 分 析 框架 


一 级 指标 ”二 级 指标 三 级 指标 说 明 
数据 层 ”数据 资 源 细 粒 度 ”数据 集 细 粒度 
APP 细 粒 度 
API 细 粒 度 
领域 分 布 = 工业 农业 /教育 文化 /安全 生产 等 
时 效 性 
格式 种 类 = 
平台 层 检索 种 类 二 高 级 检索 /关键 词 检索 等 
访问 转换 率 二 
用 户 反馈 一 文本 挖掘 模型 计算 出 的 高 频 词 


笔者 以 复旦 大 学 数字 与 移动 治理 实验 室 于 2021 
年 10 月 发 布 的 《中 国 地 方 政府 数 据 开放 报告 (指标 体 
系 与 省 域 标杆 )》 中 的 18 个 省 级 评估 对 象 为 参考 ,并 于 


供 可 行 方案 。 
4 ”各 省 级 政府 开放 数据 平台 对 比分 析 


4.1 数据 资源 细 粒 度 

数据 开放 成 为 进一步 研究 和 创新 知识 的 第 一 阶 
段 ,对 数据 的 生产 、 传 播 . 管 理 和 使 用 方式 产生 了 直接 

的 影响 。 合 理 划 分 数据 资源 ,有 利于 降低 用 户 获取 数 
据 时 的 时 间 成 本 和 人 力 成 本 ,提高 政府 开放 数据 平台 
的 可 用 性 。 本 文通 过 “ 细 粒 度 ” 指 标 衡量 数据 资源 划 
分 的 丽 密 程 度 ,其 计算 公式 为 :数据 资源 细 粒 度 = 资源 
数量 /领域 分 布 情况 ,具体 采用 数据 集 细 粒度 .APP 细 
粒度 .API 细 粒 度 进 行 综合 反映 。 

由 于 同类 数据 资源 数值 相差 较 大 ,因而 笔者 采用 
数据 资源 细 粒 度 的 中 值 作为 对 比 标准 :如 果 高 于 标准 ， 
则 认为 数据 资源 划分 较 下 ; 反 之 , 则 划分 较 密 。 根 据 以 
上 分 析 原 则 统计 了 14 个 省 (区 市) 的 数据 集 、API 接 
口 .APP 细 粒 度 情 况 并 进行 对 比 ( 见 表 2) ,并 将 政府 开 
放 数 据 平 台 划 分 的 吏 密 情况 进行 可 视 化 , 见 图 2。 

从 图 2 可 以 看 出 ,我 国 各 省 级 政府 开放 数据 平台 
细 粒 度 并 不 均衡 ,差异 较 大 ,大 多 数 划 分 不 太 合 理 。 


89 


图 二 情 骤 三 作 ChinaXiv 合 作 期 刊 
第 66 卷 第 7 期 2022 年 4 月 


数据 获取 
才 据 层 指标 
图 1 数据 处 理 流 程 
表 2 数据 集 数量 及 涉及 领域 
省 数据 集 API 接口 APP 
区 和 数量 个 领域 数 /个 。。 细 粒 度 数量 /个 。 ”领域 数 /个 。。 细 粒 度 。 ”数量 /个 。 ”领域 数 /个 。” 细 答 度 
济南 172 二 = = a 三 5 4 1.25 
东 940 19 49.47 66 379 19 3 493.63 150 19 7.89 
西 141 10 3; 一 一 一 9 5 本 : 
西 122 12 10.17 4 2 2 = 一 至 
夏 1 770 38 46. 58 8 4 2 3 2 Re 
[ers 806 21 38.38 1 609 20 80.45 10 6 1.67 
源 江 1 059 22 48.14 1 106 22 50.27 52 22 2.36 
南 233 16 14.56 1 256 22 57.09 一 a = 
建 2 223 23 96. 65 1 258 23 54.7 15 8 1.88 
东 6 182 12 S15.17 235 by 21.36 54 11 4.91 
西 5 254 23 228. 43 401 17 23.59 46 10 4.6 
放 3 158 21 150.38 二 宇 二 全 = 
北 209 10 20.9 = = 到 本 = 加 
加 图 
6356 288.91 


| 
| 
| 
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数据 集 细 粒度 API 细 粒度 


chinaXi 


NO 


APP 细 粒度 


图 2 数据 资源 划分 疏 密 程度 对 比 
6 ) 数值 居于 中 位 数 
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其 中 ,划分 较 朴 的 省 (区 、 市 ) 需 要 重新 考虑 分 类 ,将 较 
大 概念 的 领域 进行 二 次 分 类 ,重新 界定 归属 。 但 是 , 数 
据 集 数量 过 大 ,会 导致 重新 分 类 时 实施 困难 ,因而 可 考 
虑 仅 对 新 增 的 数据 集 进行 加 工 。 我 国政 府 开 放 数 据 平 
人 台 处 于 建设 完善 中 ,数据 资源 需求 可 能 还 不 稳定 ,后 续 
增幅 未 知 。 因 此 ,划分 较 密 的 省 (区 .市 ) 可 维持 现状 ， 
随 着 各 省 (区 市) 数据 集 进 入 稳定 发 展 阶 段 后 ,再 考 
4.2 领域 分 布 

数据 集 的 领域 分 布 指 归属 不 同 领域 的 数据 集 占 总 
数据 集 的 比例 。 结 合 各 省 (区 .市 ) 的 经 济 水 平 . 教 育 
水 平 政策 风向 等 方面 ,不同 领域 数据 集 的 占 比 可 以 反 
映 出 不 同 省 级 政府 开放 数据 平台 在 该 时 期 的 工作 要 点 
0 0 a 


理解 ,也 可 以 为 后 续 政 府 开 放 数 据 平 台 的 发 展 导 向 提 
供 有 效 的 反馈 。 

经 过 汇总 发 现 ,14 个 省 级 政府 开放 数据 平台 涉及 
的 领域 共计 79 个 。 由 于 其 划分 数据 集 的 标准 不 一 ,可 
能 会 出 现 以 下 问题 :中 存在 相近 的 领域 ,如 "文化 休 
闲 ” 与 “文化 ”;@@ 表 达 内 容 相同 但 表达 的 术语 不 同 ,如 
“ 安 监 "和 “安全 监管 ”;(3“ 暂 无 “其 他 ”领域 的 含义 
不 明确 。 针 对 上 述 问题 ,笔者 采用 以 下 解决 方式 :四 将 
内 容 相似 或 者 相同 的 领域 进行 合并 ,减少 元 余 的 领域 
数 ;@ 将 “和 暂 无 “其 他 "统一 归 为 “未 分 配 ” 领域 一 类 。 
经 过 整理 ,将 79 个 领域 重新 归 类 并 划分 为 政务 领域 以 
及 资源 .能源 、 环 境 领 域 等 30 个 领域 ,领域 的 分 类 和 占 
比如 表 3 和 图 3 所 示 : 


表 3 领域 分 布 归 类 
【ew ) 一 级 指标 二 级 指标 
G8 综合 政务 
(能 源 .环境 领域 资源 能 源 .资源 环境 .环境 ,资源 ,能源 安全 
放量 领 质量 
有 产权 领域 知识 产权 
(人 医疗 卫生 ,卫生 健康 ,卫生 ,医疗 
(仙人 域 信用 体系 ,信用 服务 .信用 
人 休闲 领域 文化 休闲 .文化 体育 .文化 
让 服务 领域 统计 服务 统计 
家 易 监 管 领域 市 场 监管 .企业 登记 监管 市 场 监督 
人 眶 食 药 安全 ,食品 药品 安全 
倒 匡 环境 保护 领域 生态 环境 .生态 环保 ,生态 
优 训 领 开 商业 服务 ,经贸 工商 .商贸 流通 
et 气象 服务 ,气象 
下 下 .农业 领域 农业 农村 工业 农业 ,农业 
信息 科技 领域 科技 创新 .信息 技术 ,科技 
经 济 .金融 领域 经 济 建设 .财税 金融 ,金融 
教育 领域 教育 文化 .教育 科技 教育 
交通 领域 交通 运输 .道路 交通 ,交通 出 行 .交通 
机 构 团体 领域 机 构 团体 
社会 民生 领域 生活 服务 .健康 保障 ,社区 治理 ,社会 资源 ,社会 民生 ,民生 服务 .社会 救助 .社会 发 展 .社会 保障 .社保 就 业 就业, 社保 
海洋 领域 海洋 
海关 口岸 领域 海关 口岸 
公共 服务 领域 公共 服务 
旅游 服务 领域 旅游 服务 
法 律 服务 领域 法 律 服务 
闻 台 合作 领域 闽 台 合作 
地 理 领 域 地 理 空间 .地 理 
城乡 建设 领域 城乡 建设 城市 建设 .城建 住房 
安全 领域 安全 生产 .公共 安全 .安全 监管 . 安 监 
未 分 配 领域 暂 无 .其 他 
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他 领域 
25.1% 


社会 民生 领域 
17.7% 


BD 市 场 监管 领域 
8.6% 


经 济 、 金 融 领域 
8.5% 


城乡 建设 领域 | 
4.1% 


医 卫 健康 领域 


5% 
资源 、 能 源 、 环 境 领 二 
5.4% 


~ 75% 
安全 领域 
机 构 团 体 领域 7% 


6.7% 


3 各 领域 数据 集 占 比 


已 有 文献 表明 ,开放 数据 需要 以 用 户 的 视角 为 切 
入 点 ,以 用 户 需求 为 导向 进行 体系 框架 的 搭建 "-” ,但 
数据 本 身 反映 的 政治 导向 也 是 不 能 忽视 的 重要 部 分 。 
近年 来 ,引起 广泛 关注 的 热 词 ,如 “ 碳 中 和 ”“ 双 减 “ 数 
守信 民 币 "ESG”“ 新 冠 肺炎 "等 持续 刷 屏 , 在 一 定 程 
度 旧 反映 了 我 国政 府 目前 的 工作 重心 和 方向 。 通 过 图 
3 中 hn ,政府 开放 的 数据 主要 集中 在 民生 市场 监管 、 


经 济 金融 教育. 安全、 机 构 团 体 、 资 源 . 能 源 \ 环 境 、 医 
疗 卫 生 、 工 业 农业 、 城 乡 建 设 等 领域 。 由 此 可 见 ,开放 
数据 的 内 容 与 我 国 当 前 的 战略 发 展 方向 实现 了 高 度 契 
合 ,不仅 体现 了 开放 数据 的 公共 价值 ,也 有 利于 在 数据 
的 可 用 性 与 用 户 需求 之 间 实 现 良好 平衡 。 
4.3 时 效 性 

在 数字 驱动 的 全 球 背 景 下 ,时效 性 作为 开放 数据 的 
原则 之 一 ,很 大 程度 上 决定 着 数据 的 质量 。 更 重要 的 是 ， 
在 以 用 户 导向 为 理念 的 市 场 背景 下 ,开放 数据 的 时 效 性 还 
能 显著 影响 用 户 的 满意 度 和 对 政府 的 信任 。 特 别 是 在 应 
对 紧急 情况 时 ,时 效 性 显得 尤为 重要 "”。 相 反 地 ,“ 过 时 ” 
的 数据 很 大 程度 上 代表 一 类 "无效" 数据 ,不 仅 实际 意义 
不 大 ,还 可 能 会 给 数据 库 带 来 过 载 的 困扰 。 因 此 ,政府 在 
进行 管理 时 ,一 方面 ,要 重视 数据 的 时 效 性 ,及 时 更 新 数据 
清单 目录 ; 男 一 方面 ,也 要 注意 对 “过 时 ”数据 的 备份 和 清 
理 , 减 少 系统 空间 的 存储 压力 ,从 技术 层面 提高 平台 运行 
效率 。 各 省 级 政府 数据 平台 的 时 效 性 如 表 4 所 示 : 


一 表 4 各 省 级 政府 数据 平台 时 效 性 
数据 集 总 量 ”2017 年 2018 年 2019 年 2020 年 2021 年 、 
区 间 0 . , . 趋势 图 趋势 说 明 
市 ) /1 占 比 /% 占 比 /% 占 比 /% 占 比 /% 占 比 /% 
oh [5 000,+%] 6 356 0.00 0.00 6.36 39. 84 53.79 持续 上 升 
未 [5000,+%] 6182 2.98 31.90 21.48 15. 88 24. 13 
nm 
> [5 000,+%] 5 254 0.00 0.00 0.00 45.98 54.02 
“号 要 州 [500,5 000 3 158 0.06 20.27 16. 12 36. 16 27.39 py 上 
a (不 含 特例 ) 
福建 [500 ,5 000 2 223 0.00 0.00 0.00 73.23 26.77 
宁夏 [500 ,5 000 1770 0.00 0.00 0.00 0.06 99.94 
浙江 [500 ,5 000 1 059 0.00 0.00 42.97 33.90 23.04 
山东 [500 ,5 000 940 21.17 14.57 1.28 46.49 16.49 
河南 [500 ,5 000 806 0.00 52.73 47.02 0.25 0.00 
整体 保持 上 升 
海南 [0,500] 233 0.00 50. 64 6.44 11.16 31.76 
(不 含 特例 ) 
入 
陕西 [0,500] 141 4.26 83.69 4.26 4.96 2. 84 
各 * +* + 
江西 [0,500] 122 16.39 13.11 0.00 0.00 70.49 
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由 表 4 可 知 ,各 省 级 政府 开放 数据 平台 的 时 效 性 

异 较 大 ,发 展 水 平 各 不 相同 。 具 体 而 言 , 在 数据 集 数 
量 在 [5 000, + wm ] 的 省 (区 .市 ) ,每 年 发 布 的 数据 集 数 
量 整体 呈现 持续 向 上 增长 的 态势 ;在 数据 集 数量 在 
[500,5 000] 的 省 (区 .市 ) ,每 年 发 布 的 数据 集 数 量 呈 
现 先 上 升 后 下 降 的 趋势 ;在 数据 集 数 量 在 [0,500] 的 
省 (区 .市 ) ,每 年 发 布 的 数据 集 数 量 整体 保持 上 升 趋 
势 。 之 所 以 前 期 上 升 ,可 能 是 因为 平台 处 于 初始 建立 
时 期 ,数据 集 的 发 布 经 历 了 从 “0 - >1” 的 过 程 ,因而 
趋势 上 表现 为 持续 上 升 ;出 现下 降 可 能 是 因为 平台 
进入 稳定 运行 阶段 ,导致 增幅 会 有 所 下 降 等 。 需 要 
注意 的 是 ,由 于 宁夏 政府 开放 数据 平台 建立 较 晚 , 虽 
然 数据 集 总 量 居中 ,但 仍 呈现 上 升 趋势 ;陕西 省 经 过 
29t8 年 的 快速 发 展 后 ,可 能 因为 陕西 省 关注 重点 偏 
向 容 共 服务 和 信用 领域 而 归属 此 类 领域 的 数据 集 
大 部分 属于 年 度数 据 ,导致 后 续 数据 集 发 布 数量 很 
4 因此 ,在 平台 稳定 运行 后 ,即使 数据 集 总 量 不 

数据 集 数量 也 会 呈现 上 升 之 后 又 下 降 的 趋势 ,而 

中 鳃 的 拐点 一 般 在 每 年 年 末 。 
4k 格式 种 类 

CJ 政府 开放 数据 平台 的 数据 集 正 持续 不 断 地 增长 ， 
而 到 据 集 往往 以 相应 格式 进行 存储 。 格 式 种 类 越 丰 
蕊 政府 数据 平台 的 开放 程度 越 高 。 从 图 4 和 图 5 中 
可 防 看 出 ,平台 数据 格式 以 XLSX .JSON .XML .CSV 为 
ee 5 -8 种 左右 为 宜 。 结 合 数据 集 总 量 来 
下 


体 分 布 较为 合理 。 具 体 来 看 ,海南 省 数据 集 仅 有 
23 针 个 ,因而 只 选用 XLS 这 1 种 使 用 最 普遍 的 数据 集 
格 的 。 广 东 省 和 四 川 省 的 数据 集 数 量 相差 不 大 ,但 数 
据 集 格式 的 种 类 数 却 成 倍数 关系 。 这 是 因为 ,广东 省 
数据 集 格式 中 PDF、TXT、DOC 3 种 数据 集 格式 只 有 个 
位 数 ,数量 过 少 ,因而 这 3 种 格式 可 忽略 不 计 。 男 外 ， 
在 对 格式 种 类 进行 规划 时 , 尽 可 能 避免 类 似 格式 都 被 
全 部 采用 ,如 “DOCX” 和 “DOC”“XLSX” 和 “XLS” 等 ， 
避免 给 系统 增加 不 必要 的 运行 负担 。 
4.5 检索 种 类 

按照 世界 银行 的 界定 ,只 有 同时 满足 以 下 两 个 条 
件 的 数据 才 被 认为 是 开放 :中 合法 开放 ,以 允许 商业 与 
非 商业 使 用 和 无 限制 重复 使 用 的 方式 明确 许可 ;中 技 
术 上 开放 ,以 机 器 可 读 的 标准 格式 提供 ,这 意味 着 它 可 
以 被 其 他 常用 的 计算 机 应 用 程序 检索 和 有 意义 地 处 
理 。 因 此 ,数据 检索 种 类 是 体现 政府 开放 数据 的 开放 
程度 高 低 的 途径 之 一 。 数 据 检索 种 类 配置 不 合理 ， 
对 于 用 户 来 说 ,会 影响 搜索 效率 ,降低 使 用 满意 度 ,其 


省 份 


i 
10 ”种 类 /个 


0 2 4 6 8 


4 数据 集 格式 种 类 数 


16.2% 
六 


XLS 


本 


JSON 
20.3% 


CSV 
17.5% 


XML 
18.5% 


5 数据 集 格式 占 比 


至 无 法 查询 获取 需要 的 数据 ;对 政府 来 说 ,可 能 会 增加 
平台 的 开发 维护 成 本 和 人 力 成 本 、 降 低 系统 的 性 能 。 
为 进一步 进行 分 析 , 笔 者 将 各 省 级 政府 数据 平台 的 检 
索 情况 进行 汇总 , 见 表 5。 
由 表 5 可 知 ,关键 词 检 索 、 目 录 检 索 和 其 他 检索 中 
的 管辖 部 门 检索 .领域 检索 地 图 服务 .数据 格式 检索 、 
地 点 检索 .时 间 范 围 检 索 .开放 方式 检索 为 常见 检索 方 
式 。 数 据 集 数 量 大 于 800 的 省 (区 .市 ) ,其 数据 检索 种 
类 基本 都 在 8 种 以 上 ;数据 集 数量 小 于 800 的 省 (区 、 
市 ) 数 据 集 检 索 种 类 基本 在 4 -5 种。 因此 ,数据 检索 
方式 的 选择 应 当 结 合 数据 集 数量 来 确定 。 另 外 ,部 分 
省 (区 \ 市 ) 还 采取 多 种 检索 方式 并 行 的 方式 ,利用 不 
同 检索 方式 的 优势 进行 互补 .搭配 使 用 ,以 实现 检索 效 
率 的 最 大 化 ,这 也 值得 参考 借鉴 。 
4.6 访问 转换 率 

访问 和 下 载 是 一 种 用 户 行为 ,是 用 户 与 平台 进行 
交互 的 一 种 方式 。 访 问 可 能 仅仅 说 明 用 户 对 该 领域 的 
关注 ,而 下 载 更 能 真实 反映 用 户 对 数据 集 的 需求 。 
此 ,结合 访问 量 和 下 载 量 , 用 其 比值 访问 转换 率 则 更 能 
全 面 衡 量 数据 集 的 “热度 ” ,反映 数据 集 的 “吸引 力 ”， 
即 访问 转换 率 = 下载 量 / 访 问 量 。 
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表 5 各 省 级 政府 数据 平台 的 检索 情况 汇总 
省 (区 、 市 )/ 数 据 集 总 量 /个 

检索 方式 四 川 “广东 广西 ”贵州 ”福建 宁夏 浙江 山东 河南 海南 河北 湖南 陕西 “江西 “合计 
6356 6182 5254 3158 2223 1770 1059 940 806 233 209 172 141 122 28 625 

文本 检索 关键 词 检索 V V V V V V V V V V V 区 V V 13 
高 级 检索 V x V x x V V V x x x x x x 5 

目录 浏览 检索 V V x x V V V V V V V V V V 12 
其 他 检索 管辖 部 门 检索 V V x V V V V V V V V V V V 13 
领域 检索 V V V V V V V V V V V x V V 13 

也 图 服务 V x V x V V V V V x x x V V 9 

数据 格式 检索 V V V V x V V V V x x x V x 9 

也 点 检索 V X V x V V x V V x x V x x J 

时 间 范 围 检 索 V x V x x V x V x x x x V x 5 

放 方 式 检索 V V V x x V x V x x x x x x 5 

接 入 方式 检索 x x V x x V x x V x x V x x 4 

于 搜索 词 位 置 检索 V x x x x x x V x x x x x 汉 2 
CC 放 机 构 检 索 x x x x x 区 区 区 x x x V x 1 
© 文件 类 型 检索 x x x V x x x x x x x x x x 1 
ee 摘要 检索 x x x x x V x x x x x x x 1 
©O 评分 检索 x x x x x V x 1 

时 11 6 9 乞 6 | 8 二 8 3 4 4 8 5 


〇 访问 转换 率 不 仅仅 是 “线性 "反映 数据 集 价值 高 
做 的 指 标 ,更 体现 着 一 种 "螺旋 式 "的 隐 性 反馈 机 骨 
歼 稻 根据 数据 集 的 访问 转换 率 来 判断 用 户 需 求 ,有 助 
:3 反 握 开放 数据 平台 发 布 内 容 的 重心 和 方向 , 换 句 
话说 , 即 政府 可 以 通过 用 户 对 数据 集 的 访问 和 下 载 情 
;个 系 验 证 政府 对 用 户 需求 的 判断 是 否 准确 。 若 存在 
偏 器, 则 政府 需要 进行 及 时 调整 。 访 问 转换 率 越 高 , 则 
说 隔 数 据 集 越 符合 用 户 需求 。 在 实际 应 用 中 ,可 能 会 
产 世 访问 转换 率 “ 虚 "高 的 情况 ,如 下 载 量 和 访问 量 均 
处 于 较 低 水 平 ,此 时 可 通过 去 除 极 值 或 事后 校对 审核 
的 方式 进行 数据 处 理 ,筛选 出 有 意义 的 数据 进行 分 析 。 
由 此 看 来 ,对 于 政府 开放 数据 平台 评估 而 言 ,访问 转换 
率 不 仅 是 一 个 比较 重要 的 参数 ,也 是 政府 在 开放 数据 
的 探索 过 程 中 用 来 及 时 调整 战略 方向 的 风向 标 。 
笔者 分 别 用 访问 量 排名 和 下 载 量 的 排名 对 访问 量 
和 下 载 量 进行 衡量 。 从 图 6 可 以 看 出 ,各 领域 内 数据 
集 数量 排名 和 访问 量 排名 ,下载 量 排名 成 线性 关系 , 访 
问 量 排名 和 下 载 量 排名 保持 一致。 换言之 ,数据 集 数 
量 越 多 的 领域 ,访问 量 和 下 载 量 越 多 ,而 且 用 户 访问 数 
据 集 时 通常 都 会 进行 下 载 。 这 些 数据 质量 较 高 ,基本 
达到 了 内 容 符合 用 户 需 求 的 标准 。 但 是 ,部 分 省 (区 、 
市 ) 仍 需要 进行 适当 改进 ,如 福建 省 访问 量 和 下 载 量 在 
一 致 性 方面 欠 佳 ,说 明 昌 然 用 户 对 该 领域 数据 感 兴趣 ， 
但 数据 内 容 质量 方面 达 不 到 用 户 需 求 ,因而 用 户 没有 


a 


i 


O 


进行 进一步 的 下 载 操 作 。 又 如 ,海南 省 数量 较 少 的 数 
据 集 反而 拥有 较 高 的 访问 量 和 下 载 量 ,说 明 政 府 还 未 
充分 站 在 用 户 需 求 的 角度 去 考虑 数据 集 的 发 布 ,没有 
及 时 做 好 数据 集 的 追踪 ,造成 了 数据 集 发 布 方向 不 明 
确 ,使 得 用 户 希 望 获取 的 数据 反而 被 忽略 。 
4.7 用 户 反馈 
政府 开放 数据 平台 的 建立 大 大 增加 了 用 户 参 与 公 

共事 务 的 机 会 。 一 般 来 说 ,普通 用 户 与 公共 事务 建设 
之 间 的 “不良 连接 ” ,忽略 了 用 户 体验 潜在 的 价值 。 但 
是 ,通过 在 政府 开放 数据 平台 创建 互动 交流 栏目 ,能 够 
克服 这 个 缺点 。 有 具体 而 言 , 可 以 通过 开放 数据 平台 上 
互动 的 强度 .互动 方式 的 丰富 性 等 来 改善 连通 性 ,获得 
日 户 反馈 。 笔 者 将 用 户 反馈 视 为 开放 数据 使 用 后 的 体 
验 情况 以 及 用 户 的 数据 需求 ,包括 使 用 过 程 中 出 现 的 
数据 问题 .系统 功能 问题 .提出 的 改善 建议 .数据 需求 
1 请 等 。 

笔者 将 政府 开放 数据 平台 的 子 栏目 下 的 互动 文本 
数据 进行 归 类 ,分 为 “数据 申请 ”“ 问 题 纠 错 ”"“ 意 见 反 
人 馈 ”“ 咨 询问 题 " 四 大 模块 。 具体 划 分 见 表 6。 
基于 上 述 划 分 的 模块 - 子 栏目 划分 ,笔者 使 用 Tf- 
idf 算法 对 各 栏目 下 的 用 户 反馈 内 容 进行 文本 挖掘 分 
析 。 通 过 哈工大 停 用 词 表 ,附加 自 定 义 词 语 (主要 是 标 
点 符号 、 官 网 回复 用 户 时 的 礼貌 用 语 以 及 省 (区 市 ) 
名 称 ) ,利用 Jieba 进行 分 词 ,得 到 排名 前 20 的 词语 后 ， 
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各 领域 数据 访问 量 及 下 载 量 排名 


一 一 访问 量 排名 
es 下 载 量 排名 


各 领域 数据 集 数量 排名 


一 
SS | 
号 3 
© 2 
be E 
< w 
© 

CD 过 
Qa i 
© 半 
> 图 
© 总 
这 

© 

表 6 模块 - 子 栏目 

模块 子 栏目 作用 


数据 申请 ”数据 申请 、 需 求 列表 ,需求 申请 反映 出 用 户 的 数据 需求 
问题 纠 错 ” 纠 错 公开 数据 纠 错 、 纠 错 列表 、 数 ”完善 政府 的 数据 治理 


据 问题 

意见 反馈 ”意见 征集 ,平台 建议 .内容 建议 , 平 ”体现 用 户 的 关注 焦点 
台 体 验 

咨询 问题 ”常见 问题 .问题 反馈 ,咨询 提问 . 问 ”改进 平台 功能 
题 咨询 


按 不 同类 目 ( 标 题词 频 、 问 题 描 述 、 回 复 词 频 ) 绘 制 词 
云图 进行 可 视 化 ,得 到 主题 词 并 追溯 相应 原文 ,以 便 更 
准确 地 对 主题 词 加 以 解读 。 

Tf-idf 算法 的 目的 是 评估 词语 的 重要 性 。 其 基本 
原理 主要 是 词语 的 重要 性 与 词语 在 文本 中 出 现 的 次 数 
成 正比 ,并 与 其 在 语料库 出 现 的 次 数 成 反比 。 换 言 之 ， 


各 领域 数据 集 数量 排名 


各 领域 数据 集 数 量 排名 


各 领域 数据 集 数 量 排名 


6 ”各 领域 数据 访问 量 、 下 载 量 排名 


某 词 在 文本 中 出 现 频率 很 高 ,在 其 他 文章 中 出 现 的 频 
率 也 很 高 ,那么 它 的 重要 性 并 不 很 大 ;但 若 在 文本 中 出 
现 频率 很 高 ,而 在 其 他 文章 中 出 现 的 频率 很 低 , 则 说 明 
重要 性 很 大 。 该 算法 优势 在 于 :可 以 较 好 地 过 滤 无 意 
义 或 者 不 相关 的 词语 (如 “通知 “青岛 ”那么 ”等 ) ， 
提高 文本 筛选 后 内 容 的 真实 性 ,而 且 简 单 .快速 。 虽 然 
它 无 法 区 分 一 词 多 义 的 情况 ,但 是 鉴于 文本 来 源 于 相 
对 客观 的 陈述 文本 ,并 非 带 有 感情 色彩 的 叙述 类 文本 ， 
最 终 本 文选 择 该 方法 进行 高 频 词 提取 。 最 终 得 到 的 各 
模块 关键 词 词 云图 , 见 图 7 -图 9。 

对 于 用 户 而 言 ,反馈 的 建议 得 到 采纳 并 解决 ,能 极 
大 地 提升 其 参与 积极 性 。 这 会 有 利于 形成 良性 的 反馈 
循环 ,整体 上 为 我 国政 府 数据 开放 平台 后 续 的 发 展 黄 
定 坚实 的 基础 。 
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图 9 “回复 词 频 "模块 词 云图 


S 总 结 与 建议 


5.1 数据 层 
5.1.1 数据 领域 的 划分 

我 国政 府 开放 数据 平台 数据 集 领 域 的 划分 合 
理性 较 差 ,在 完善 时 应 当 结 合 数据 集 数量 、 现 行政 
策 以 及 本 省 ( 区、 市) 特色 综合 考虑 ,不 应 划分 得 过 
下 或 过 密 ,避免 导致 政府 维护 成 本 增加 以 及 用 户 搜 
索 困 难 等 问题 。 


5.1.2 数据 格式 的 选择 

目前 ,各 省 级 政府 开放 数据 平台 数据 集 格 式 配置 
较为 合理 。 在 后 续 平台 建设 时 ,数据 集 格式 可 以 将 
XLSX JSON XML .CSV 这 4 种 作为 基础 格式 ,并 且 尽 
量 避 免 使 用 类 似 功能 的 格式 。 其 余 格式 则 可 根据 需 
求 .收集 数据 难 易 程度 或 数据 本 和 号 情 况 等 综合 考虑 是 
否 进行 发 布 。 
5.1.3 数据 内 容 的 发 布 

经 过 对 比分 析 , 当前 开放 数据 平台 发 布 的 内 容 与 
政策 方向 契合 度 较 高 ,但 仍 存在 一 定 的 改进 空间 。 一 
方面 ,数据 集 的 发 布 应 当 结 合 访问 转换 率 的 指标 进行 
考虑 ,对 热点 领域 的 数据 集 应 当 重 点 关注 ,访问 量 很 少 
的 数据 集 可 以 考虑 不 进行 发 布 。 由 于 用 户 的 关注 点 是 
动态 变化 的 ,因而 政府 应 当 定 期 梳理 追踪 ,做 好 数据 集 
发 布 的 清单 目录 ,重视 数据 集 发 布 的 “ 靶 向 ”性 ,提高 
平台 数据 的 实用 价值 。 另 一 方面 ,数据 集 的 发 布 应 当 
保证 数据 的 “新 鲜 度 ”, 及 时 更 新 ,为 用 户 提供 最 新 的 
数据 ,并 做 好 旧 数 据 集 的 备份 处 理 。 这 也 是 加 强 政府 
数据 开放 平台 数据 质量 治理 、 提 高 用 户 对 政府 的 满意 
度 的 途径 之 一 。 
5.2 平台 层 
5.2.1 检索 方式 的 使 用 

信息 检索 应 当 具 备 全 面 性 、 灵 活性、 高 效 性 特点 。 
因此 ,各 省 (区 市) 在 加 强 对 政府 开放 数据 平台 数据 
集 管理 的 同时 ,应 当 注 意 结合 该 省 (区 市) 数据 集 的 
数量 配置 ,对 多 种 检索 方式 相互 搭配 使 用 。 这 样 既 能 
提高 用 户 的 检索 效率 ,也 能 减少 开发 人 员 的 维护 成 本 。 
5.2.2 培训 工作 的 开展 
由 政府 或 非 营 利 组 织 做 好 政府 开放 数据 平台 使 用 
的 培训 工作 ,如 通过 拌 音 、 微 博 等 线 上 平台 来 宣传 使 用 
方法 ;编纂 用 户 使 用 指南 来 引导 用 户 操作 等 。 例 如 ,与 
北美 和 欧洲 不 同 ,非洲 国家 获得 开放 政府 数据 的 途径 
往往 有 限 ,因而 它们 驾驭 技 术 并 将 其 作为 增长 动力 的 
能 力也 有 限 。CFA( Code for Africa) 是 非洲 最 大 的 公民 
技术 和 数据 新 闻 实验 室 网 络 ,在 20 个 国家 或 地 区 设 有 
团队 。 这 个 组 织 则 在 培养 社区 内 的 技术 和 编码 技能 ， 
为 公民 创造 机 会 ,让 他 们 成 为 政府 .企业 和 公共 机 构 
的 监督 者 。 这 个 组 织 不 仅 将 开放 数据 视 为 潜在 的 公 
共 资 产 ,而 且 已 经 开发 了 一 个 数据 奖学金 项 目 , 能 将 
数据 技能 培训 的 人 员 欣 入 各 种 媒体 和 非 营 利 组 织 区 
项 目 中 。 
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5.2.3 用户 反 馈 的 完善 
相关 人 员 在 对 用 户 的 反馈 进行 解答 时 , 尽 可 能 模 
板 化 .具体 化 ,把 切实 解决 用 户 的 问题 作为 目标 。 空 


据 得 到 广泛 的 开发 利用 ,增强 用 户 对 政府 的 信任 ， 
方便 用 户 通 过 数据 进行 研究 创新 ,推动 社会 的 发 展 。 
笔者 通过 对 各 省 级 政府 开放 数据 平台 的 数据 层 和 平台 


话 、 套 话 会 让 用 户 产生 较 差 的 体验 感 ,从 而 对 用 户 与 政 
府 之 间 的 互动 交流 产生 负面 影响 ,不 利于 政府 数据 开 
放 平台 的 长 期 发 展 ,因此 应 尽量 避免 。 基 于 词 云图 的 
主题 词 ,笔者 从 中 总 结 出 未 来 平台 应 当 改进 的 方向 ,大 
致 有 如 下 几 点 : 

(1) 内 容 精 准 、 及 时 化 。 目 前 ,用 户 在 需求 上 更 倾 
向 获取 关于 教育 文化 ,行业 资源 方面 的 数据 信息 ,如 高 
考分 数 ,水库 资源 旅游 数据 等 。 但 是 ,用 户 的 需求 是 
动态 的 ,意味 着 政府 应 当 综合 用 户 反 馈 、 时 事 热点 、 国 
家 大 政 方针 等 做 出 调整 ,并 且 及 时 更 新 。 如 此 ,才能 让 
开放 数据 平台 的 数据 真正 得 到 利用 ,做 到 用 数据 驱动 
经 浮 社 会 的 发 展 。 
CB(2) 功能 简洁 .便捷 化 。 政 府 开放 数据 平台 部 分 
项 甬 使 用 存在 技术 问题 ,如 实名 认证 操作 异常 等 。 但 
牙科 开放 数据 平 台 相关 负责 人 员 则 回复 ,用 户 反映 的 
这 止 问题 中 有 部 分 是 正常 运行 的 。 两 者 产生 冲突 的 原 
攻关 可 能 是 因为 政府 开放 数据 平台 不 稳定 ,浏览 名 不 
棋 闹 用 户 不 会 操作 等 。 针 对 上 述 现象 ,笔者 提出 如 下 
建 济 :首先 ,重视 数据 治理 ,提高 数据 的 真实 性 、 准 确 
性 ;工交 ,通过 多 渠道 宣传 指导 、 对 新 增 页 面 进行 功能 
识 明 ,优化 界面 .明确 各 栏目 查询 路 径 等 方式 ,加 强 对 
用 加 的 应 用 指导 ,减少 用 户 操作 过 程 中 不 必要 的 “ 弯 
路 号 最 后 ,以 用 户 为 中 心 ,考虑 不 同人 群 在 使 用 上 的 难 
KE 了 新 增 老年 模式 、 残 疾 人 模式 等 专门 页 面 ,为 弱势 
群体 打开 绿色 通道 ,提升 用 户 体验 。 

(3) 解答 专业 .具体 化 。 在 解答 用 户 反馈 的 问题 
时 ,由 于 系统 异常 等 原因 ,需要 技术 进行 维护 "等 不 
太 具 体 的 回复 不 在 少数 。 这 种 解答 往往 不 仅 不 能 解决 
问题 ,还 可 能 起 到 反作用 ,让 用 户 产生 烦躁 等 消极 情 
绪 ,并 认为 反馈 是 一 种 浪费 时 间 的 无 用 行为 。 因 此 , 建 
议 制定 具体 的 解答 模板 ,如 问题 描述 、 解 决 方式 解决 
时 间 、 处 理 机 构 、 举 报 邮箱 等 。 更 重要 的 是 ,政府 应 当 
做 好 反馈 解答 的 检查 工作 ,定期 复查 问题 的 解决 情况 。 


6 结语 


搭建 政府 数据 开放 平台 的 初衷 是 为 了 促进 开放 数 


层 进行 比较 人 研究, 发现 能 够 借鉴 的 优势 以 及 存在 的 问 
题 ,并 提出 了 相关 的 建议 。 在 研究 过 程 中 ,由 于 政府 开 
放 数 据 平台 的 内 容 是 动态 更 新 的 ,使 得 本 文 所 搜集 的 
数据 存在 一 定 的 滞后 性 ,从 而 给 分 析 结 果 带 来 影响 。 
在 今后 的 研究 中 ,可 以 通过 不 同 的 研究 方式 或 技术 手 
段 来 解决 此 类 问题 。 另 外 ,政府 开放 数据 平台 比较 的 
维度 还 有 进一步 扩展 的 空间 ,未 来 研究 可 以 增加 研究 
对 象 .扩展 对 比 维度 ,从 而 提升 政府 开放 数据 平台 发 展 
建议 的 普 适 性 。 
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Abstract: | Purpose/Significance | Taking 14 provincial government open data platforms in China as the re- 
search object, this paper makes a comparative analysis of them from multiple dimensions, providing references and 
suggestions for the development of government open data platforms in China. | Method/ Process | The crawler tech- 
nology was used to acquire data, and the descriptive analysis of the data was carried out, and the Tf-idf model was 
used for text mining. Starting from the dimensions of data layer and platform layer, qualitative and quantitative analy- 
sis methods were used to compare fine granularity of data, domain distribution, timeliness, type of format, type of re- 
trieval , access conversion rate and user feedback. | Result/ Conclusion | At present, open data platforms in different 
Provinces( autonomous regions and municipalities) have different degrees of development, and there is certain room 
I improvement. For example, the release plan for data sets should take into account the province ( autonomous re- 
ns and municipalities ) characteristic and the number of data sets, etce. In the process of construction, attention 

uld be paid to the open platform data retrieval methods, training and user feedback. 
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C3 国家 重大 战略 需求 与 图 情 档 研究 的 作用 与 能 力 29. 


图 书馆 大 安全 管理 与 应 急 服 务 
和 图 书馆 学 ,情报 学 .档案 学 研究 方法 与 技术 创新 30. 国际 图 书馆 管理 与 服务 发 展 趋势 研究 
三 3 开放 科学 环境 下 科学 交流 范式 的 新 变革 31. 图 书馆 多 源 数 据 融 合 及 治理 
后 疫情 时 代 学 术 信息 交流 模式 的 变化 与 影响 32. 图 书馆 小 数据 与 暗 数据 的 价值 评 佑 与 应 用 研究 
C8 新 时 代 “ 信 息 资源 管理 "学科 内 涵 与 理论 体系 构建 33. 教育 新 基建 与 图 书馆 建设 
C6. 新 文科 建设 视角 下 “信息 资源 管理 "学 科 战 略 规划 34. 图 情 档 机 构 重组 与 队伍 的 专业 化 研究 
学 科技 竞争 背景 国家 文献 资源 保障 策略 研究 35. 图 书馆 助力 乡村 振兴 的 策略 研究 
-全 媒体 数字 资源 中 心 的 设计 与 研究 36. 健康 信息 学 的 理论 与 方法 
“9， 政 府 数字 资源 管理 与 长 期 保存 37. 健康 信息 行为 和 个 人 健康 信息 管理 
10. 政府 开放 数据 管理 与 隐私 保护 38. 虚假 健康 信息 治理 
11. 开放 科学 数据 数据 安全 与 个 人 信息 保护 39. 风险 信息 的 识别 .监测 与 传播 
12. 数字 经 济 中 的 数据 功能 及 作用 机 制 40. 区 块 链 与 信息 安全 问题 
13. 面向 深度 知识 服务 的 拓展 型 信息 资源 标准 与 规范 研究 41. 面向 全 民 全 社会 的 数字 素养 能 力 与 数字 素养 教育 
14. 基于 数据 挖掘 的 文献 资源 智能 采 选 推荐 算法 研究 42. 图 书 情报 与 档案 管理 学 科 课 程 思 政 建设 
15. 面向 高 价值 专利 培育 的 知识 产权 信息 服务 理论 研究 与 实践 探索 43.“ 元 宇宙 ” 场 域 下 图 情 档 学 科 的 研究 课题 设置 
16. 面向 交叉 学 科 的 跨 学 科 知 识 组 织 方法 与 实践 研究 44. 文 旅 融合 背景 下 图 书馆 与 档案 馆 服务 创新 
17. 国内 外 情报 工作 制度 演变 与 我 国情 报 工作 制度 创新 45. 数字 人 文 与 数字 学 术 的 新 发 展 
18. 支持 高 水 平 科技 自立 自强 的 情报 学 理论 方法 46. 面向 文化 遗产 的 数字 人 文 研究 
19. 关键 核心 技术 重大 突破 情报 监测 与 识别 理论 与 方法 47. 少数 民族 文献 遗产 建 档 研 究 
20. 聚焦 创新 驱动 的 核心 关键 领域 情报 分 析 服 务 研究 48. 红色 文献 .红色 档案 与 红色 记忆 研究 
21. 面向 国家 发 展 战略 需求 的 安全 情报 研究 49. 档案 治理 能 力 提 升 研 究 
22. 中 美 科技 对 抗 下 国家 情报 战略 研究 50. 档案 计算 学 
23. 智能 情报 与 数据 智能 研究 51. 数字 出 版 与 新 型 出 版 研究 
24. 国家 总 体 安全 观 下 应 急 管理 信息 服务 及 情报 体系 52. 学 术 评 价 改革 与 创新 
25. 重大 突 发 事件 下 应 急 情报 协同 及 与 情 引 导 53. 数 智 赋 能 的 创新 评价 
26. 高 校 图 书馆 在 履行 高 校 五 大 基本 职能 过 程 中 的 作用 研究 54. 其 他 
27. 智慧 图 书馆 研究 与 应 用 实践 创新 《图 书 情报 工作 》 杂 志 社 
28. 图 书馆 高 质量 发 展 的 内 涵 与 评价 2021 年 12 月 
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